CodeGolf Bench: benchmark multilingüe de generación concisa de código en LLMs CodeGolf Bench: benchmark dinámico para evaluar LLMs en generación de código conciso en 60 lenguajes. Modelos de razonamiento lideran en eficiencia. 2026-06-01 · 2 min